Trasformare le osservazioni grezze in strutture oggetti R è il flusso tecnico necessario per l'analisi probabilistica. Prima di modellare le distribuzioni, dobbiamo padroneggiare l'ingresso dei dati e le sottigliezze strutturali tra liste, matrici e frame di dati.
1. Ingresso strutturato
Importare i dati tramite scan() spesso richiede una struttura di lista fittizia per definire i tipi di variabile (ad esempio, list(id="", x=0)). Questo garantisce che i dati esterni da file come input.dat vengano analizzati in componenti gestibili invece che in vettori piatti.
2. Organizzazione dimensionale
Mentre una matrice viene utilizzata per insiemi numerici omogenei (utilizzando byrow=TRUE), la data.frame() funge da ponte definitivo per il modello statistico, consentendo a tipi di dati eterogenei di coesistere.
3. Accessibilità delle variabili
Accedere ai dati per l'inferenza implica l'indicizzazione tramite inp[[1]] o colonne denominate come inp$id. Funzioni come attach() consentono di accedere alle variabili nel oggetto completo (come eruptions) ad essere accessibili direttamente senza indicizzazione ripetuta.